Welcome to pandas!

7.14 实例3 提取各分组下唯一值

对类型列执行分组,并且罗列各类型下的子类

import pandas as pd

df=pd.read_excel(r"D:\Pyobject2023\object\测试\素材\1.7.14 实例3 提取各分组下唯一值.xlsx")

print (df)

# t=df.groupby("细分市场").apply(lambda d:d.产品名称.unique()).to_frame().reset_index().rename(columns={0:"产品名称"})

# {0:"产品名称"}中的0不是字符类型

t=df.groupby("细分市场").agg({"产品名称":lambda s:s.unique()}).reset_index()

print (t)

返回:

物料编号 数量 财务日期 收入 产品名称 细分市场
0 1292-401-41-3 4980.0 2023-12-19 0.00 排母 工业控制
1 1272-061-12-1 8960.0 2023-12-29 0.00 排母 医疗&其他
2 1272-061-12-1 8960.0 2023-12-29 0.00 排母 医疗&其他
3 1207-032-17-3 3200.0 2023-12-25 0.00 排针 数据通信
... ... ... ... ... ... ...
10606 80-0012-6784-0 1000.0 2024-02-21 12373.18 S87 工业控制
10607 80-0013-8735-8 72000.0 2024-02-27 18927.43 Midgie(排母) 工业控制

[10608 rows x 6 columns]


细分市场 产品名称
0 医疗&其他 [排母, SCI, 排针, 牛角连接器, 汽车连接器, WAFER, 网口连接器...
1 工业控制 [排母, S87, D-SUB, WAFER, 排针, 牛角连接器, 网口连接器, 电源插座...
2 数据通信 [排针, 牛角连接器, WAFER, Tx-PCIe, Tx-26P miniSAS, 电源...
3 新能源 [排针, 排母, nan, 牛角连接器, WAFER, IC插座, D-SUB, 汽车连接器]